Évaluation de modèles de classification automatique appliqués à la détection d'opinions
نویسندگان
چکیده
This paper describes the problem of classifying opinions expressed into sentences. The system must categorize them as opinionated or factual. To achieve this objective, we have used a Naïve Bayes approach and Support Vector Machines. As a new categorization model, we suggest using a normalized score (Z score) based on a specific vocabulary. Using a NTCIR test collection, our evaluations demonstrate that the suggested model based on the Z score performs significantly better than the others and that a representation based on words tends to show better performance level than surrogates based on lemmas. MOTS-CLÉS : détection d’opinions; classification d'opinions ; évaluation de classifieurs.
منابع مشابه
Amélioration des Performances des Systèmes Automatiques de Reconnaissance de la Parole pour la Parole Non Native
Résumé Dans cet article nous décrivons une approche pour la reconnaissance automatique de la parole (RAP) non native. Nous proposons deux méthodes pour l’adaptation d’un système de reconnaissance automatique de la parole (SRAP) existant. La première se base sur la modification des modèles acoustiques par l’intègration des modèles de la langue maternelle (LM). Les phonèmes de la langue parlée (L...
متن کاملLa morphologie mathématique binaire pour l'extraction automatique des bâtiments dans les images THRS
RÉSUMÉ. Cet article présente une nouvelle méthode de détection et d’extraction des bâtiments en milieu urbain à partir d’images satellitaires à très haute résolution spatiale. L’approche proposée est fondée sur l’application et l’enchainement automatique d’opérateurs issus de la morphologie mathématique binaire. Plusieurs étapes constituent la méthode : (1) binarisation de l’image, (2) filtrage...
متن کاملProsodic Phrase Break Prediction: Problems in the Evaluation of Models against a Gold Standard. (Prédiction des frontières prosodiques entre syntagmes : le problème de l'évaluation des modèles à l'aide d'un corpus de référence)
The goal of automatic phrase break prediction is to identify prosodic-syntactic boundaries in text which correspond to the way a native speaker might process or chunk that same text as speech. This is treated as a classification task in machine learning and output predictions from language models are evaluated against a ‘gold standard’: human-labelled prosodic phrase break annotations in transc...
متن کاملDétection et regroupement automatique de style d'écriture dans un texte
Résumé. La détection de plagiat extrinsèque devient vite inefficace lorsque l’on n’a pas accès aux documents potentiellement sources du plagiat ou lorsque l’on se confronte à un espace aussi vaste que le Web, ce qui est souvent le cas dans les logiciels anti-plagiat actuels. Dès lors la détection intrinsèque devient nettement plus efficace. Dans cet article, nous traitons justement de la détect...
متن کاملProsodic Phrase Break Prediction: Problems in the Evaluation of Models against a Gold Standard
The goal of automatic phrase break prediction is to identify prosodic-syntactic boundaries in text which correspond to the way a native speaker might process or chunk that same text as speech. This is treated as a classification task in machine learning and output predictions from language models are evaluated against a ‘gold standard’: human-labelled prosodic phrase break annotations in transc...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2010